info

Google'ın Proje Astra, Veo ve Gemini Güncellemesi: Yapay Zeka İlerlemesi Savaşları

Bu, Google'ın OpenAI'ye yanıtıdır.

Günlük hayatta gerçekten kullanılabilecek bir genel yapay zeka, şu anda böyle değilse basın toplantısı düzenlemek utanç verici olurdu.

15 Mayıs sabahı, yıllık "Teknoloji Dünyası Bahar Festivali Gala" etkinliği Google I/O Geliştirici Konferansı resmen başladı. 110 dakikalık ana açılışta yapay zeka kaç kez bahsedildi? Google bunu saydı:

Evet, yapay zeka her dakika konuşuluyor.

Üretken yapay zekanın rekabeti son zamanlarda yeni bir zirveye ulaştı ve bu I/O konferansının içeriği doğal olarak yapay zeka etrafında dönüyor.

“Bir yıl önce bu sahnede, yerel çoklu modlu büyük model planlarımızı ilk kez paylaştık, Gemini. Bu, yeni nesil I/O'yu işaret etti,” dedi Google CEO'su Sundar Pichai. “Bugün, herkesin Gemini'nin teknolojisinden faydalanmasını umuyoruz. Bu çığır açan özellikler, arama, görseller, üretkenlik araçları, Android sistemleri ve daha birçok alana nüfuz edecek.”

Şu anda, hem 1.5 Pro hem de 1.5 Flash kamu önizlemesi için mevcut ve Google AI Studio ve Vertex AI'de 1 milyon token bağlam penceresi sunuyor. Şimdi, 1.5 Pro ayrıca API kullanan geliştiriciler ve Google Cloud müşterileri için bekleme listesi aracılığıyla 2 milyon token bağlam penceresi sağlıyor.

Ayrıca, Gemini Nano saf metin girişinden görüntü girişine genişletildi. Bu yıl ilerleyen zamanlarda, Pixel ile başlayarak Google çoklu modlu Gemini Nano'yu piyasaya sürecek. Bu, mobil kullanıcıların yalnızca metin girişini işlemekle kalmayıp, aynı zamanda görseller, ses ve konuşma dili gibi daha fazla bağlamsal bilgiyi anlamalarını sağlayacak.

Gemini ailesi yeni bir üye ile karşılıyor: Gemini 1.5 Flash

Yeni 1.5 Flash hız ve verimlilik için optimize edilmiştir.

Yeni Nesil Açık Kaynak Büyük Model Gemma 2

Bugün, Google ayrıca açık kaynak büyük model Gemma için bir dizi güncelleme yayınladı - Gemma 2 burada.

Tanıtıldığı gibi, Gemma 2 devrim niteliğindeki performans ve verimlilik sağlamayı amaçlayan yeni bir mimari kullanıyor; yeni açık kaynak model parametreleri 27B'dir.

Uzun videolara gelince, Veo 60 saniye veya daha uzun videolar üretebilir. Bunu tek bir istem aracılığıyla veya bir hikaye anlatmak için bir araya getirilen bir dizi istem sağlayarak yapabilir. Bu, video üretim modellerinin film ve televizyon prodüksiyonundaki uygulamaları için anahtar noktadır.

Veo, Google'ın Üretken Sorgu Ağı (GQN), DVD-GAN, Görüntüden Videoya, Phenaki, WALT, VideoPoet, Lumiere ve diğerleri dahil görsel içerik üretimindeki çalışmalarına dayanmaktadır.